تحلیل درستنمایی ماکزیمم مدل رگرسیون لجستیک در حالتی که داده های متغیرهای پیشگو کامل نیستند ولی متغیرهای کمکی وجود دارند
نویسندگان
چکیده
مقدمه و هدف: داده های گمشده در بسیاری از مطالعات آماری از جمله مدلهای رگرسیونی وجود دارند و باعث کاهش دقت برآورد می شوند. تا کنون روشهای گوناگونی برای مقابله با مشکل داده های گمشده ابداع شده که عموما بر داده های گمشده متغیر پاسخ متمرکز بوده است حال آنکه متغیرهای پیشگو نیز می توانند دستخوش تغییر و از دست رفتن اطلاعات شوند.مواد و روشها: در این تحقیق ضمن بررسی روش جانهِی داده هاِی گمشده با استفاده از الگوریتم em و متغیر کمکی, نتایج حاصل از این روش را با روش تحلیل مورد کامل در یک مدل رگرسیون لجستیک پیرامون عوامل مؤثر بر انتخاب نوع زایمان مقایسه می کنیم. یافته ها: داده هاِی مورد استفاده در این مقاله از یک مطالعه توصیفِی پیرامون عوامل مرتبط با انتخاب نوع زایمان در زنان مراجعه کننده به مراکز بهداشتِی و درمانِی شهر تهران بدست آمده است. حجم نمونه دراِین تحقِیق ۳۸۵ نفر بوده و از روش نمونه گِیرِی چند مرحله اِی انتخاب شدندو مشخصات فردی، سوابق ماماِیِی، نوع نگرش و عوامل اجتماعِی نمونه ها از طرِیق پرسشنامه ثبت شدند. براِی مقایسه میزان کارایِی دو روش، برآورد انحراف معیار پارامترها مورد استناد قرار گرفت. بحث و نتیجه گیری : نتایج حاصل نشان می دهد روش تحلیل درستنمایی با الگوریتم em در مقایسه با روش مورد کامل کارایی بهترِی دارد. مشکل داده هاِی گمشده در بسیارِی از مطالعات آمارِی وجود دارد و موجب اریبی و کاهش کارایی می شوند. در این بررسی نشان داده ایم استفاده از الگوریتم em براِی جانهِی گمشده هادر یک مدل رگرسیون لجستیک با متغیرهاِی توضیحِی گسسته و سپس تحلیل مدل، از روش مورد کامل که مستلزم حذف گمشده ها به همراه قسمتهایی از اطلاعات است کاراتر است. از سوی دیگر اگر متغیر توضیحِی ناکامل پیوسته باشد بدست آوردن مدل، روشی متفاوت می طلبد و یا می توان با تبدیل آن به متغیری گسسته از روش قبل استفاده کرد.
منابع مشابه
مقایسه روش بیزی (Bayesian) و کلاسیک در برآرد پارامترهای مدل رگرسیون لجستیک با وجود مقادیر گمشده در متغیرهای کمکی
Background and Aim: Logistic regression is an analytic tool widely used in medical and epidemiologic research. In many studies, we face data sets in which some of the data are not recorded. A simple way to deal with such "missing data" is to simply ignore the subjects with missing observations, and perform the analysis on cases for which complete data are available. Materials and Methods: We c...
متن کاملمدل رگرسیون لجستیک چند متغیره با داده های ناکاملی از متغیرهای مستقل
در مطالعات و آزمایشاتی که متغیر پاسخ گسسته است و دو یا بیشتر از دو مقدار را به خود اختصاص می دهد، مدل رگرسیون لجستیک به عنوان روش استاندارد آنالیز داده ها مطرح می شود. در این پایان نامه، ابتدا استفاده از پارامترهای میانگین جهت آنالیز رگرسیون پاسخ دو تایی چندگانه مطرح می شود. بدین صورت که با استفاده از نسبت های وابستگی تعریفشده در قالب پارامتر میانگین، ارتباط ها را مدلبندی می کنیم. نسبت های وابس...
بهکارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر همخطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان
Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of ...
متن کاملمقایسهی دو رهیافت برای برخورد با متغیرهای کمکی گمشده در رگرسیون لوژستیک
در طول 2۵ سال گذشته پیشرفتهای روششناسانهای در زمینهی تیمار دادههای گمشده صورت گرفته است. بیشتر مطالعههای انتشاریافته روی دادههای گمشده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشتهاند. مطالعهی حاضر در پی آن است که این خلأ را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیممسازی (EM) وزنها و جانهی چن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
مجله اپیدمیولوژی ایرانجلد ۱، شماره ۱، صفحات ۶۵-۷۲
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023